1 |
『昭和話し言葉コーパス』の設計と構築
|
|
|
|
Abstract:
専修大学 / 国立国語研究所 研究系 音声言語研究領域 客員教授 ; 国立国語研究所 研究系 音声言語研究領域 ; 国立国語研究所 研究系 音声言語研究領域 ; Senshu University / Invited Professor, Spoken Language Division, Research Department, NINJAL ; Spoken Language Division, Research Department, NINJAL ; Spoken Language Division, Research Department, NINJAL ; 国立国語研究所基幹研究プロジェクト「大規模日常会話コーパスに基づく話し言葉の多角的研究」では,2016年度より『昭和話し言葉コーパス』(SSC: Showa Speech Corpus)の構築を進めてきた。2021年3月にその構築作業が完了し,コーパス検索アプリケーション「中納言」で一般公開を開始した。『昭和話し言葉コーパス』は,1950年代から1970年代にかけて国立国語研究所で作成された録音資料群を再編成し,現代の技術で話し言葉コーパスとして整備したものである。過去の音源を現代の技術でコーパス化したという点において,日本語では従来存在しなかったタイプのコーパスであると言える。また,現代の話し言葉コーパスと連結し,比較・対照することによって,話し言葉の経年変化を探るための「通時音声コーパス」として利用できる点で,画期的である。本稿では,今回構築した『昭和話し言葉コーパス』について,そこに収録されている録音資料群の出自や当時の国立国語研究所の状況,コーパス構築の過程とアノテーション,さらに予備的な分析結果について述べる。 ; Construction of the "Showa Speech Corpus" (SSC) began in 2016, and was completed in March 2021 and made available to the public online through the corpus search application Chunagon. The SSC consists of a collection of recordings made from the 1950s to the 1970s by the National Institute for Japanese Language and Linguistics. Thus, it is a speech corpus made with modern technology, but with old recordings as its content. The SSC is innovative in that it can be used to explore the changes in spoken language over time (i.e., as a "diachronic speech corpus") by linking, comparing, and contrasting the SSC with modern spoken language corpora such as the Corpus of Spontaneous Japanese (CSJ) and the Corpus of Everyday Japanese Conversation (CEJC). In this paper, we describe the origins of the recorded materials stored in the SSC, the process of corpus construction and annotation, and the results of the preliminary analysis.
|
|
Keyword:
annotation; diachronic change of spoken language; diachronic speech corpus; Research in the Colloquial Japanese; Showa Speech Corpus (SSC); 『昭和話し言葉コーパス』(SSC); 『談話語の実態』; アノテーション; 話し言葉の経年変化; 通時音声コーパス
|
|
URL: https://repository.ninjal.ac.jp/?action=repository_uri&item_id=3539 https://repository.ninjal.ac.jp/?action=repository_action_common_download&item_id=3539&item_no=1&attribute_id=54&file_no=1 http://id.nii.ac.jp/1328/00003522/
|
|
BASE
|
|
Hide details
|
|
3 |
話し言葉の多様性 : コーパスから見えてくること
|
|
|
|
In: https://www2.ninjal.ac.jp/openhouse/2019/ (2021)
|
|
BASE
|
|
Show details
|
|
4 |
日中バイリンガル児の中国語の発達に関する事例研究 : 物の受け渡しにおける「谢谢(ありがとう)」に着目して
|
|
|
|
In: https://ccd.ninjal.ac.jp/lrw2021.html (2021)
|
|
BASE
|
|
Show details
|
|
5 |
幼児の発話順番取得のストラテジーに関する予備的考察 : 園児の話し合い活動の事例分析から
|
|
|
|
In: https://ccd.ninjal.ac.jp/lrw2021.html (2021)
|
|
BASE
|
|
Show details
|
|
6 |
コーパスに見る日常のことばの特徴
|
|
|
|
In: https://www2.ninjal.ac.jp/openhouse/2020/ (2021)
|
|
BASE
|
|
Show details
|
|
7 |
日常生活に見られることばの使い分け
|
|
|
|
In: https://www2.ninjal.ac.jp/openhouse/2018/ (2021)
|
|
BASE
|
|
Show details
|
|
9 |
『日本語日常会話コーパス』(2018年度版)の調整頻度を活用した分析
|
|
|
|
In: https://www2.ninjal.ac.jp/conversation/event/lecture10.html (2021)
|
|
BASE
|
|
Show details
|
|
11 |
脱文脈化の観点からみる職場における取引先との談話の特徴
|
|
|
|
In: https://pj.ninjal.ac.jp/corpus_center/lrw2020.html (2020)
|
|
BASE
|
|
Show details
|
|
12 |
子ども-保護者間会話における[要求-拒否]のやり取り
|
|
|
|
In: https://pj.ninjal.ac.jp/corpus_center/lrw2020.html (2020)
|
|
BASE
|
|
Show details
|
|
13 |
子どもの会話コーパスの構築に向けて
|
|
|
|
In: https://pj.ninjal.ac.jp/corpus_center/lrw2020.html (2020)
|
|
BASE
|
|
Show details
|
|
14 |
家庭での幼児の発話の修辞機能 : 脱文脈化の観点からの検討
|
|
|
|
In: https://pj.ninjal.ac.jp/corpus_center/lrw2019.html (2019)
|
|
BASE
|
|
Show details
|
|
15 |
子どもによるやり取りへの参与の振る舞い : 両親との会話の事例分析から
|
|
|
|
In: https://pj.ninjal.ac.jp/corpus_center/lrw2019.html (2019)
|
|
BASE
|
|
Show details
|
|
16 |
『日本語日常会話コーパス』モニター公開版:研究の可能性
|
|
|
|
In: https://pj.ninjal.ac.jp/corpus_center/lrw2019.html (2019)
|
|
BASE
|
|
Show details
|
|
|
|